Day 21 - AI QA Engineer：AC 撰寫與測試策略 - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2025 iThome 鐵人賽

DAY 21

生成式 AI

AI-Driven Development - 個人開發者的敏捷實踐系列第 21 篇

Day 21 - AI QA Engineer：AC 撰寫與測試策略

17th鐵人賽

團隊籠中鳥

2025-09-21 23:21:24

418 瀏覽

分享至

經過前面二十天的探索，我們從 AI Product Owner 的需求梳理，到 AI UX Designer 的視覺呈現，現在要進入 SDD AI Sprint 的第四個關鍵環節 - AI QA Engineer。這個角色不僅僅是找 bug 的測試員，更是品質的守護者，確保每一個功能都符合預期的行為標準。

從感覺測試到行為驗證

還記得以前寫測試的痛苦嗎？開發完功能後，硬著頭皮補測試，常常不知道該測什麼、測到什麼程度才算夠。更糟的是，寫出來的測試往往只是為了通過 coverage，而不是真正在驗證業務邏輯。

AI QA Engineer 改變了這個局面。它不是等到最後才介入，而是從需求階段就開始思考「如何驗證這個功能是否正確」。這正是 BDD（Behavior-Driven Development）的精髓 - 先定義期望的行為，再開發功能來滿足這些行為。

Given-When-Then 的 AI 自動生成

BDD 的 Given-When-Then 格式看似簡單，實際撰寫時卻充滿挑戰。什麼該放在 Given？When 要多細緻？Then 要驗證到什麼程度？這些問題常常讓人卡關。

我發現 AI 在這方面特別擅長，因為它能夠：
理解上下文的完整性：AI 會自動識別哪些前置條件是必要的，避免遺漏關鍵設定。比如測試購物車結帳時，它會記得要先設定用戶登入狀態、商品庫存、支付方式等前置條件。

維持一致的粒度：人工撰寫時常會出現有些測試太細、有些又太粗的問題。AI 會根據功能的重要性和複雜度，維持適當的測試粒度。

考慮時序和狀態：很多 bug 來自於狀態管理和時序問題。AI 會自動加入等待機制、狀態檢查，確保測試的穩定性。

Edge Case 的 AI 識別與補充

最讓開發者頭痛的往往不是正常流程，而是各種邊界情況。使用者總是會做出你意想不到的操作，而這些 Edge Case 正是系統穩定性的關鍵。

AI 的 Edge Case 思維模式

我觀察到 AI 在識別 Edge Case 時有幾個獨特的思維模式：
極值思維：自動考慮最大值、最小值、空值、零值。比如在分頁功能中，它會測試第一頁、最後一頁、超出範圍的頁碼、負數頁碼等情況。
組合爆炸：當有多個條件時，AI 會系統性地測試各種組合。不是盲目的排列組合，而是基於風險評估選擇最可能出問題的組合。
時間維度：考慮並發、競態條件、超時、重試等時間相關的場景。這些是人工測試最容易忽略的地方。
使用者異常行為：快速點擊、重複提交、瀏覽器前進後退、網路斷線重連等真實世界會發生的情況。

舉個實際例子，當我請 AI 為一個簡單的登入功能生成 Edge Case 時，它給出了這些場景：

密碼欄位貼上包含特殊字符的內容
在載入過程中切換語言設定
使用瀏覽器的密碼自動填充後立即提交
在不同標籤頁同時嘗試登入不同帳號
系統時間與伺服器時間不同步的情況

這些都是我自己可能想不到，但在真實環境中確實會發生的情況。

測試數據的智能準備

好的測試需要好的測試數據。但準備測試數據往往是個繁瑣的工作，特別是當你需要各種不同情境的數據組合時。

從領域模型到測試數據

還記得我們在 DDD 中定義的領域模型嗎？AI QA Engineer 會基於這些模型自動生成符合業務邏輯的測試數據。

比如在電商系統中，它不會只生成隨機的商品資料，而是會考慮：

商品類別的合理分布
價格區間的真實性
庫存量與銷售量的關係
評價數量與商品上架時間的相關性

這種智能生成的數據更接近真實情況，能夠發現那些只在特定數據組合下才會出現的問題。

數據場景的系統化管理

基準數據集（Baseline Dataset）：最小可測試的數據集，包含各種類型的基本案例，用於快速驗證基本功能。
壓力數據集（Stress Dataset）：大量數據，用於測試系統的效能邊界。不只是數量多，還要考慮數據的分布和關聯複雜度。
異常數據集（Anomaly Dataset）：各種不符合預期的數據，包含格式錯誤、邏輯矛盾、惡意輸入等。
情境數據集（Scenario Dataset）：模擬真實業務場景的數據，比如黑色星期五的流量、月底結帳的高峰、季節性的需求變化。

完整測試計劃的 AI 協作

測試不是孤立的活動，而是整個開發流程的一部分。AI QA Engineer 最大的價值在於它能夠串連起整個測試生命週期。

測試策略的動態調整

傳統的測試計劃往往是靜態的，一旦制定就很少改變。但實際開發中，需求會變、時程會調整、資源會限制。AI QA Engineer 能夠根據這些變化動態調整測試策略。

基於風險的優先級調整：當時間緊迫時，AI 會自動識別高風險區域，優先測試核心功能和最容易出錯的部分。
增量測試的智能規劃：新功能加入時，AI 不只測試新功能本身，還會識別可能受影響的既有功能，進行回歸測試。
測試覆蓋的差距分析：AI 會分析現有測試案例與需求規格的對應關係，找出尚未覆蓋的場景。

測試即文檔的實踐

我特別喜歡的一點是，AI 生成的測試案例本身就是絕佳的文檔。每個 Given-When-Then 都清楚地說明了系統的行為規範。

這帶來幾個好處：
新人上手更容易：看測試案例就能理解系統的業務邏輯，比看冗長的規格文件更直觀。
需求變更可追蹤：當需求改變時，相應的測試案例也會更新，形成了一個活的文檔系統。
溝通成本降低：產品、開發、測試三方都用同一套語言（Given-When-Then）溝通，減少理解偏差。